Sber AI: смена парадигмы архитектуры данных под AI‑агентов
Источник: https://t.me/SberAIScience/4217
Краткое содержание
Пост канала Sber AI Science (со ссылкой на материал коллег из СберТеха). Отправная аналогия: когда Amazon внедрил роботов на складах, он отказался от человеческой навигации в пользу системы координат. С данными происходит аналогичный сдвиг: классические подходы — звёздная схема, medallion‑архитектура, дата‑каталоги — спроектированы под SQL‑разработчиков, которым нужна «карта» данных. AI‑агенты устроены иначе: «они не смотрят на карту», «не ищут данные через навигацию», «они запрашивают значение напрямую». Авторы подчёркивают: данные — не «коробки на складе», их структура определяет, какие вопросы можно к ним задать. Поэтому речь не об отказе от структуры, а о смене её роли — с навигации на «операционную семантику», от пайплайнов к смыслу. Если человеку не хватает контекста, он переспросит, а агент так не может — отсюда системные ошибки. Прежние попытки решать это через глоссарии, семантические слои и каталоги в массе не «взлетели» из‑за низкой окупаемости. Сейчас стоимость отсутствия контекста становится измеримой через качество решений агентов, и это меняет экономику инвестиций в семантику.
Пример
cubes:
- name: orders
sql: SELECT * FROM raw.orders WHERE deleted_at IS NULL
measures:
- name: gmv
sql: amount_usd
type: sum
description: "Сумма заказов в USD по дате создания (created_at)"
dimensions:
- name: status
sql: status
type: string
meta:
allowed_values: [new, paid, refunded, cancelled]
Значимость
Материал отражает свежий тренд индустрии: переход к «AI‑native data products» (метрик‑слой как первичный API, MCP/ACP‑интерфейсы к данным, переход от ETL к декларативной семантике). Параллельно ту же мысль продвигает JetBrains в посте «IDE Is Already an AI Quality Variable» (см. эпизоды 30 апреля у того же автора): структурированный контекст важнее, чем сам выбор модели. Для отечественной аудитории это первое заметное программное высказывание Сбера на тему «данные для агентов, а не людей».
🧾 Транскрипт (формат)
О БУДУЩЕМ АРХИТЕКТУРЫ ДАННЫХ 🤩
Источник: https://t.me/SberAIScience/4217
О БУДУЩЕМ АРХИТЕКТУРЫ ДАННЫХ 🤩
Коллеги из СберТеха поделились интересным кейсом. Коротко пересказываем суть 🤩
Когда Amazon внедрила роботов на складах, компания убрала навигацию, рассчитанную на человека, и перешла на систему координат 🤖
С данными сейчас происходит похожий сдвиг. Классические подходы — star schema, medallion-архитектура, каталоги — создавались под SQL-разработчиков.
AI-агенты устроены иначе:
🟣 они не «смотрят на карту» данных 🟣 они не ищут данные через навигацию 🟣 они запрашивают значение напрямую
И тут важный момент: данные — не коробки на складе.
Их структура определяет, какие вопросы к ним можно задать. Поэтому речь не об отказе от структуры, а о смене её роли: 🔗 с навигации → на операционную семантику 🔗 от пайплайнов → к смыслу
🤩 О том, как проектировать среду для агентов и почему это важнее промптинга, можно прочитать в канале наших коллег, а также в МАКС
Если человеку не хватает контекста, он уточнит. Агент так не может, и это приводит к системным ошибкам.
Попытки решить это уже были: глоссарии, семантические слои, каталоги. Большинство не взлетело из-за низкой окупаемости.
Сейчас ситуация меняется: стоимость отсутствия контекста впервые становится измеримой через качество решений агентов 🖥
Поэтому смена оператора — это не про автоматизацию процессов, а про пересборку самой модели работы с данными.
Полный материал — тут 🤩
Что думаете? ❤️ — хочется узнать об альтернативах 🔥 — надо идти в ногу со временем